Die Generierung natürlicher Sprache aus einer formalen Repräsentation
نویسنده
چکیده
Since the 50’s there have been many attempts to design computer programs which are able to translate texts from one natural language into another. Despite 40 years of intensive research the systems developed so far are still far from being able to translate texts correctly. In this thesis we present a different approach to the machine generation of texts into several languages, namely their generation from the expressions of a formal language. The idea underlying this is that an author formulates his text in a formal language. This language contains all the information which the computer needs to produce a natural language text in the desired target languages. The problem of the analysis of a natural language source text, which has, to a great extent, not yet been mastered in machine generated translation, does not arise with this approach. The first part of the thesis deals with the question of which form a formal language must take if it is to produce texts of a sufficiently large fragment of speech. In the second part we then cite algorithms which produce German, English and French sentences from the expressions of the formal language. In addition, a more user-friendly version of our formal language is part of our research project. Its syntax is discussed in a separate paper. It allows the user to work with a disambiguated fragment of his mother tongue, which can be translated unambiguously into the formal version. This way he does not have to work with the actual formal language, for it is very machine-oriented and therefore unwieldy. This abstract, for example, has been written in the user-friendly version of the formal language. The possible practical applications of our method are obvious: For example, an author who wishes to publish a text in various natural languages can write his text in the formal language. The computer then takes over the task of formulating the text in the desired target languages. The same applies when an author wishes to formulate a text in a language with which he is not familiar. This procedure has definite advantages over translations by a person or a machine: When a formal language is used as source language, there is no need for the analysis of the source text in the natural language. This is a problem which has to date been insufficiently resolved in machine translation. In the case of non-specialist persons doing the translation there is the additional problem of specialist texts being misunderstood.
منابع مشابه
Entwurf einer domänenspezifischen Sprache für elektronische Stellwerke
Die Entwicklung elektronischer Stellwerke für den Bahnbetrieb ist ein aufwändiges Unterfangen, welches sich besonders für die zahlreichen Nebenstrecken und andere kleinere Bahnanlagen häufig als unrentabel erweist. Um in Zukunft einerseits mehr Verkehr auf die Schiene zu bringen und zudem die Kosten für den Betrieb der Infrastruktur zu senken, müssen die Hardware-Komponenten günstiger werden, a...
متن کاملModell-basierte Programmgenerierung und Methoden des Übersetzerbaus - Zwei Seiten derselben Medaille?
In der vergangenen Dekade hat Modell-basierte Entwicklung in der Softwaretechnik zunehmende Bedeutung gewonnen, vgl. z.B. [TS07, SRC12, JLM12]. Aus Modellen, die in einer formalen Sprache definiert sind (Domänen-spezifische Sprache) wird Code generiert, der die Modelle implementiert. Da Domänen-spezifische Sprachen nicht selten starken Änderungen und Erweiterungen unterworfen sind, haben sich W...
متن کاملModel-to-Code-Transformation mit der Model to Text Transformation Language
Die Model-to-Text Transformation Language ist eine Sprache der Object Management Group zur Transformation von formalen Modellen zu Text bzw. Code. Dieser Beitrag stellt beispielhaft die Code-Generierung auf der Basis eines UML-Klassenmodells vor, wobei einige der Sprach-Features in Verbindung mit OCL zum Einsatz kommen. Auch einige Hinweise zur praktischen Anwendung seien gegeben. 1 Model-to-Te...
متن کاملVerstehen natürlicher Sprache für den Mensch-Maschine-Dialog
In diesem Beitrag wird ein System zum automatischen Verstehen sowie zum automatischen Übersetzen natürlicher, gesprochener Sprache beschrieben. Das Kernstück ist hierbei ein semantischer Decoder, welcher aus einem vorverarbeiteten Sprachsignal mit einer stochastischen maximum-a-posteriori Klassifikation unmittelbar eine semantische Darstellung bestimmt. Dabei wird akustisches, phonetisches, syn...
متن کاملfOOSE- Eine integrierte formale Softwareentwicklungsmethode
Die Methode “fOOSE” (formal Object-Oriented Software Engineering) exemplifiziert eine auf der “Unified Modeling Language” (UML) basierende, integrierte formale Softwareentwicklungsmethode: Jacobsons “Object-Oriented Software Engineering”-Methode (OOSE) wird um diagrammgestützte, formale Spezifikationen, Beweisverpflichtungen und Verfeinerungen erweitert. Die diagrammatischen UMLModelle werden u...
متن کامل